首页> 外文OA文献 >Loop scheduling with complete memory latency hiding on multi-core architecture
【2h】

Loop scheduling with complete memory latency hiding on multi-core architecture

机译:隐藏在多核体系结构上的具有完整内存延迟的循环调度

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

The widening gap between processor and memory performance is the main bottleneck for modern computer systems to achieve high processor utilization. In this paper, we propose a new loop scheduling with memory management technique, iterational retiming with partitioning (IRP), that can completely hide memory latencies for applications with multi-dimensional loops on architectures like CELL processor (J.A. Kahle et al., 2005). In IRP, the iteration space is first partitioned carefully. Then a two-part schedule, consisting of processor and memory parts, is produced such that the execution time of the memory part never exceeds the execution time of the processor part. These two parts are executed simultaneously and complete memory latency hiding is reached. Experiments on DSP benchmarks show that IRP consistently produces optimal solutions as well as significant improvement over previous techniques
机译:处理器和内存性能之间不断扩大的差距是现代计算机系统实现高处理器利用率的主要瓶颈。在本文中,我们提出了一种新的具有内存管理技术的循环调度技术,即带分区的迭代重定时(IRP),它可以完全隐藏像CELL处理器这样的具有多维循环的应用程序的内存延迟(JA Kahle等,2005)。 。在IRP中,首先要仔细划分迭代空间。然后,产生由处理器和存储器部分组成的两部分时间表,使得存储器部分的执行时间永远不会超过处理器部分的执行时间。这两个部分同时执行,并且达到了完全的内存延迟隐藏。 DSP基准测试表明,IRP始终如一地提供最佳解决方案,并且比以前的技术有了显着改进

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号